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摘 要 : [目的 /意义 ] 对 上 海 图 书馆 举办 的 2020 年 数字 人 文 年 会 会 议 征集 的 51 个 汉语 语 境 下 数字 人 文 项 目 进行 分 析 , 总 
结 汉语 世界 关于 中 华文 化 主题 的 数字 人 文 项 目 概 况 ,为 国内 数字 人 文 的 未 来 发 展 提供 参考 。[ 方 法 /过 程 ] 采 用 网 
络 调查 法 和 数据 分 析 法 对 51 个 数字 人 文 项 目 进行 分 类 研究 ,根据 项 目的 研究 对 象 、 研 究 方 法 、 基 础 设施 类 型 和 项 
目 成 果 的 现实 意义 进行 分 析 与 讨论 以 获取 有 价值 的 特征 。 就 “数字 人 文 与 人 文学 科 ”“ 技 术 手 段 与 方法 应 用 ”“ 基 
础 设施 建设 “服务 模式 与 问题 解决 ”四 个 维度 进行 深入 探讨 。[ 结果 /结论 ]51 个 项 目的 总 结 显示 出 五 大 特点 :在 


能 力 和 基础 资源 建设 的 主要 建议 。 
i: 数字 人 文 DH2020 数字 人 文 年 会 ”中 华文 化 
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历史 学 文学 领域 莲 勃 发 展 , 机 器 学 习 与 数字 人 文 深度 


结合 ,数字 资源 建设 至 关 重 要 ,综合 性 数字 人 文平 台 的 时 代 
已 经 到 来 , 跨 学 科 、 跨 机 构 、 跨 国家 的 合作 性 项 目 开 始 显现 。 本 文 也 针对 当前 数字 人 文 项 目 存在 的 不 足 提出 了 促 
进 机 构 间 合作 及 多 学 科 交 又 融合 ,加 强大 数据 交叉 思维 和 人 文 素养 培养 ,加 强 区 域 协同 发 展 , 继 续 提 升学 科 服 务 
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€ 数字 人 文 落地 中 已 整 十 年 ,十 年 间 , 国 内 数字 人 
文 领域 一 方面 奋力 追赶 世界 脚步 , 另 一 方面 也 在 追问 
AB 梳理 当下 。 以 “积淀 与 超越 :数字 人 文 与 中 华文 
ft CBenevolence and Excellence: Digital Humanities and 
Chirese Culture ) ”为 主题 的 数字 人 文 年 会 (DH2020 ) 于 
2020. 年 在 上 海 召开 。 本 届 会 议 深度 聚焦 数字 人 文 领 
域 的 中 国 问题 ,反映 了 中 国 数字 人 文 领域 的 最 新 研究 
成 果 学科 产 出 和 发 展 趋势 ,为 国内 外 人 文学 者 提供 一 
个 高 水 平 高 层次 的 学 术 交 流 平台 。 会 议 期 间 发 起 了 
中 国 主题 的 数字 人 文 优秀 项 目的 征集 和 评选 活动 ,此 
次 大 会 征集 到 的 项 目 集中 代表 了 近 十 年 来 汉语 世界 数 
字 人 文 的 重要 实践 成 果 。 本 文 依托 各 个 项 目 详尽 的 申 
报 材料 ,从 研究 对 象 、 人 研究 方法 、 基 础 设施 类 型 分 析 和 
现实 意义 四 个 维度 梳理 归纳 当前 汉语 语 境 下 数字 人 文 
项 目的 进展 现状 ,为 我 国 数字 人 文 研究 与 实践 提供 参 
考 。 


1 数字 人 文 项 目 研究 综述 
数字 人 文 (Digital Humanities, DH) 起源 于 人 文 计 


算 (Humanities Computing)" , 随 着 计算 机 技术 、 互 联网 
技术 、 多 媒体 技术 等 新 兴 技 术 的 发 展 而 形成 新 型 跨 学 
科研 究 领域 ”” 。20 世纪 90 年 代 起 ,“ 人文 计算 ”被 广 
泛 应 用 于 超 文本 、 音 频 、 视 频数 字 地 图 等 多 个 对 象 , 涵 
盖 历 史 、 艺 术 、 语 言 学 等 多 个 领域 ;2001 年 “数字 人 
文 ” 概 念 首次 出 现 , 并 随 着 关联 数据 本 体 等 技术 的 出 
现 得 到 了 迅速 发 展 ” ,呈现 出 数据 密集 型 特征 ,其 技术 
工具 .数据 资源 和 科研 需求 得 到 良性 互动 与 协同 发 
RH, 

国际 上 ,数字 人 文 已 有 丰富 成 果 。 全 球 范围 内 有 
超过 183 个 与 “数字 人 文 " 相 关 的 研究 中 心 .数字 人 文 
协会 .团队 或 实验 室 六 ,这 些 研 究 中 心 大 多 依托 于 大 学 
或 图 档 博 机 构 , 拥 有 完善 的 硬件 设施 和 完备 的 科研 能 
力 。 较 为 著名 的 研究 中 心包 括 耶 鲁 大 学 数字 人 文 实验 
室 ”\ 麻 省 理工 大 学 HyperStudio ^' .日 本 立 命 馆 大 学 京 
都 文艺 数字 人 文 研究 中 心中 悉尼 大 学 数字 人 文 研究 
小 组 ;数字 人 文 协会 包括 国际 数字 人 文 组 织 联盟 
(The Alliance of Digital Humanities Organizations ) \. 澳 大 
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亚 数 字 人 文 协会 (Australasian Association for Digital 
欧洲 数字 人 文 协 会 (European Association 
for Digital Humanities ) .日 本 数字 人 文 协会 (Japanese 


及 了 对 部 分 国内 数字 人 文 项 目的 分 析 与 梳理 。 吕 瑞 
成 . 韩 涛 ”同样 在 2019 年 图 书馆 前 沿 技 术 论 坛 的 会 


议 综述 中 介绍 了 部 分 的 数字 人 文 项 目 。 由 此 可 见 , 目 


Association for Digital Humanities) 等 。 这 些 国外 的 人 研究 
中 心 和 数字 人 文 机 构 如 火 如 茶 开 展 了 大 量 数字 人 文 项 
H ,相关 实践 经 验 值得 参考 和 借鉴 ,因此 我 国学 者 对 
际 数字 人 文 项 目 做 了 一 些 梳理 和 总 结 。 邓 要 然 ” 
14 个 美国 图 书馆 领域 数字 人 文 项 目 进行 研究 ,， i 
主题 热点 和 特征 。 赵 雪 芹 等 ” 从 项 目 设立 、 技 术 运 
用 、 展 览 服务 等 角度 探索 包括 时 间 线 旅行 线 项 目 ( 床 省 
理工 学 院 ) 纽伦堡 实验 项 目 ( 哈 佛 大 学 ) 、 蓝 山 项 目 
(普林斯顿 大 学 ) 在 内 的 美国 排名 前 10 位 的 多 个 高 校 
图 书馆 数字 人 文 项 目 。 徐 彤 阳 、 顾 婷 婷 ”梳理 日 本 数 
守 大 文 项 目 整 体 概况 ,总 结 其 在 研究 主题 .研究 深度 与 
JE 数据 开放 程度 以 及 研究 重点 方面 的 特征 。 徐 彤 
EE 杨 明 害 " 分 析 澳大利亚 数字 人 文 项 目 后 发 现 澳 大 


i a 以 DHcommons 项 目 she 
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EB. UE iu 
性 国家 的 数字 人 文科 研 动态 ,同时 也 为 我 国 的 数字 人 
六 六 目 工作 提供 借鉴 

三 国际 数字 人 文 项 目 建设 的 壬 勤 发 展 也 推动 了 国内 
Je ACUTE IUIS. Ep 2011 年 国内 第 一 个 数字 人 
文 咯 完 中 心 在 武汉 大 学 成 立 以 来 ,国内 高 校 和 图 档 博 
机 构 纷纷 成 立 相 关 的 数字 人 文 研究 及 工作 机 构 , 如 北 
京 哆 学 数字 人 文 研究 中 心 .上海 图 书馆 历史 人 文大 数 
据 中 心 .复旦 大 学 人 文 社 科 数 据 研 究 所 .华东 师范 大 学 
调查 与 数据 中 心 .南京 大 学 高 研 院 数字 人 文 创 研 中 心 
等 ,这 些 机 构 承 担 起 了 国内 数字 人 文 项 目 建设 与 发 展 
的 重任 。 国 内 学 者 也 对 这 些 项 目的 发 展 进行 追踪 和 分 
析 。 刘 炜 . 叶 认 中 从 宏观 层面 对 数字 人 文 整体 方法 论 
和 理论 结构 进行 研究 探讨 。 高 胜 寒 等 "通过 文献 计量 
方法 对 国内 数字 人 文 已 有 成 果 进 行 综述 ,详细 分 析 了 
该 领域 内 知识 基础 .研究 热点 和 研究 趋势 。 蔡 迎春 
对 国内 特色 资源 数据 库 建设 中 的 数字 人 文 应 用 进行 了 
研究 。 苏 敏 呈 侧重 对 国内 图 书馆 开展 的 数字 人 文 服 
务 的 研究 成 果 进行 论述 ,明确 我 国 图 书馆 数字 人 文 服 
务 研究 的 发 展 方向 。 吴 丽 萍 "” 运用 文献 计量 法 对 图 
书馆 在 数字 人 文 服务 中 的 角色 定位 .研究 工具 .教育 培 
训 ,岗位 培训 等 内 容 进行 评述 。 朱 本 军 、 苔 华 229 在 对 
第 一 第 二 届 北 京 大 学 数字 人 文 论坛 会 议 进行 综述 时 涉 


| $ 


前 国内 数字 人 文 的 综述 研究 主要 集中 在 对 方法 论 和 理 
耸 结 构 的 探讨 ,发展 方向 和 前 景 的 讨论 .图 书馆 数字 人 
文 服务 的 开展 以 及 资源 数据 库 和 平台 的 建设 , 少 有 对 
汉语 语 境 下 数字 人 文 项 目 全 面 和 专题 的 综述 ,而 已 有 
的 项 目 综述 仅 包 含 在 历届 会 议 综述 中 。 因 此 ,本 文 将 
依托 2020 年 数字 人 文 年 会 (DH2020 ) 项 目 征集 评选 的 
契机 ,依据 每 个 项 目 组 提交 的 项 目 资料 (包括 系统 平台 
工具 建设 .资源 库 、 知 识 库 建 设 及 可 视 化 等 相关 的 网 
站 、App 小 程序 .图 片 及 视频 等 ) ,对 汉语 语 境 下 数字 
人 文 项 目 进行 全 面 梳理 和 分 析 , 从 项 目 研 究 对 象 ` 研 究 
方法 .类 型 分 析 和 现实 意义 四 个 方面 对 国内 数字 人 文 
实践 情况 进行 归纳 总 结 评述 。 


2 DH2020 征集 项 目 基本 情况 


2.1 项 目 评选 情况 

2020 数字 人 文 年 会 优秀 项 目 评选 采取 专家 征集 
和 项 目 组 自行 报名 相 结合 的 方式 ,共产 生 76 个 候选 项 
H ,组 委 会 对 76 个 候选 项 目 中 评选 意向 不 确定 的 项 目 
vien 言 息 的 初步 确定 后 ,发送 了 优秀 项 目 评 
选 意愿 征询 函 , 经 过 汇总 最 终 产 生 26 个 项 目 参 加 优秀 
项 目的 评选 。 此 外 ,对 未 参评 的 项 目 进 行 再 次 梳理 , 整 
理 出 25 个 数字 人 文 项 目 , 共 计 51 个 项 目 加 入 此 次 年 
会 综述 。 优 秀 项 目 评选 设置 最 佳 项 目 奖 、 最 佳 创意 奖 、 
最 佳美 工 设计 奖 和 最 佳 题材 奖 4 类 奖项 ,最 终 评 出 11 
个 优秀 项 目 。 项 目 基 本 情况 见 表 1 和 表 2。 
2.2 项 目 基本 情况 分 析 

从 项 目的 建设 机 构 所 在 国家 、 地 区 来 分 析 , 大 多 数 
汉语 语 境 的 数字 人 文 项 目 建设 方 为 国内 机 构 , 有 3 个 
项 目 有 海外 机 构 ( 美 国 ) 参 与 , 男 有 1 个 来 自 德国 的 独 
立项 目 。 而 从 图 1 所 有 国内 独立 建设 的 项 目 中 分 析 ， 
约 63% (33 个 ) 的 项 目 来 自 于 北京 (16 个 ) 和 上 海 (17 
个 ) ,这 反映 出 北京 和 上 海 是 目前 国内 数字 人 文 研究 较 
为 领先 的 地 区 , 产 出 了 较 多 优秀 的 研究 成 果 ,研究 成 果 
得 到 专家 学 者 的 肯定 和 认同 。 同 时 发 现 ,台湾 地 区 也 
十 分 重视 数字 人 文 项 目的 建设 ,共有 6 个 项 目 被 推荐 
参评 ,其 项 目 建设 成 果 受 到 领域 学 者 的 普遍 认可 。 

从 图 2 项目 建设 机 构 的 类 型 来 分 析 ,51 个 项 目 共 
有 33 家 机 构 参 与 建设 ,其 中 19 家 为 高 校 ( 占 比 约 
58% ) ,5 家 科研 机 构 ( 占 比 约 1596 ) ,5 家 公共 图 档 博 
( 占 比 约 15% ) 和 4 家 商业 机 构 ( 占 比 约 12% ) ,此 外 还 
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表 1 26 个 参评 项 目 基 本 情况 


"m 项 目 名 称 地 区 建设 机 构 学 科 项 目 类 型 资源 类 型 WAM 
XM01 《中 国 历史 人 物资 料 库 》 (CE — 北京 ”北京 大 学 史学 平台 与 工具 .系统 建 ”结构 化 数据 广 
DB) 在 线 查询 系统 第 二 设 
版 一 面向 用 户 需求 的 重新 设 
计 与 实现 
XMO2 — 唐 宋 文学 编 年 地 武汉 中南 民族 大 学 文学 .史学 数字 资源 建设 结构 化 数据 E 
XMO3 — 董 其 昌 数 字 人 文 展示 系统 上 海 。 ERYR 艺术 数字 资源 建设 图 像 文本 * 
XM04 — 中 国 多 世代 人 口 数据 库 香港 。 ”香港 科技 大 学 史学 .社会 学 。 数字 资源 建设 .系统 ”结构 化 数据 广 
建设 
XM05 。 台湾 大 学 数字 人 文中 心 建构 。 台湾 台湾 大 学 图 书 情报 平台 与 工具 ,系统 建文 本 .结构 化 数据 广 
之 数字 人 文 分 析 系统 与 个 人 设 
DH 研究 平台 
XM06 。 六 朝 建 康 城市 历史 信息 系统 MX 南京 大 学 史学 数字 资源 建设 结构 化 数据 * 
XM07 。 印 藏 :复旦 大 学 印 谱 文 献 虚拟 。 “上海 。 ”复旦 大 学 艺术 数字 资源 建设 kt * 
qti 
RW08 。 南京 地 区 侵 华 日 军 慰 安 所 的 。 ”南京 。 南京 大 学 史学 数字 资源 建设 综合 * 
> 0 AR 故事 地 区 
"Xo 方志 物产 知识 库 构建 及 深度 ”南京 “南京 农业 大 学 史学 数字 资源 建设 文本 .结构 化 数据 。 容 
CO 利用 研究 
ET 基于 F HMRI RI 武汉 大 学 艺术 数字 资源 建设 图 像 文本 * 
O 
XM 高 迁 古村 数字 记忆 网 站 北京 。 中 国人 民 大 学 史学 数字 资源 建设 .系统 ”综合 5 
iih “成 疫 中 的 复旦 "专题 数字 特 。“ 上海。 复 日 大 学 图 书 情报 医学。 数字 资源 建设 综合 5 
RFA 
RI 历史 文化 名 人 游学 足迹 知识 上海 ”上海 大 学 史学 平台 与 工具 结构 化 数据 * 
N E TRAE 
XMi4 。 中 国 古籍 基础 数据 分 析 平台 。 ” 上海 。 “上 海外 国语 大 学 文学 数字 资源 建设 .平台 ”结构 化 数据 文本 广 
> 与 工具 
YMS 。 多 源 异 构 学 术 成 果 大 数据 的 bE 复旦 大 学 图 书 情报 平台 与 工具 结构 化 数据 广 
O MASNA 
mo 。 融合 机 器 智能 与 群体 智慧 的 。 上海。 华东 师范 大 学 图 书 情报 文学 ”平台 与 工具 结构 化 数据 文本 广 
:= 三 十 籍 数据 化 实践 
$e 中 国 近 现代 书画 印 本 数据 库 。“” 上海 。 华东 师范 大 学 艺术 数字 资源 建设 a 一 般 
XMI8 。 分 布 式 数字 人 文 研究 与 教学 上海。 ”华东 师范 大 学 图 书 情报 平台 与 工具 结构 化 数据 E 
实 训 环境 
XM19 ”复旦 大 学 东亚 语言 数据 中 心 HE ZAK% 语言 学 数字 资源 建设 结构 化 数据 * 
XM20 HARMER R 武汉 大 学 艺术 .史学 数字 资源 建设 结构 化 数据 * 
据 发 布 服务 平台 
二 和 3E Ez] o3 T dl 
xu : m 图 谱 可 视 化 系 北京。 北京 大 学 文学 数字 资源 建设 图 谱 r 
2b 
XM22 — 丝绸 之 路 地 理 信息 开放 平台 。 北京 ”首都 师范 天 学 史学 数字 资源 建设 结构 化 数据 * 
陕西 。 陕西 师范 大 学 出 版 社 有 限 
责任 公司 
XM23 — 家谱 知识 服务 平台 上 海 。 “上海 图 书馆 上 海 科学 技术 ”史学 平台 与 工具 ,系统 建文 本 ,图像 广 
情报 研究 所 设 
XM24 — sinoPedia: 关 联 数据 服务 平台 。“ 上海 。 “上 海 图 书馆 上 海 科学 技术 图 书 情报 方法 和 工具 结构 化 数据 5 
情报 研究 所 
XM25 。 中国 十 代 皇 室 家 族 树 ( 赵 宋 、 北京 。 清华 大 学 史学 数字 资源 建设 文本 * 
本 唐 . 朱 明 ) 
XM26 中国 历史 地 理 信息 系统 HE 。 复 量 大 学 史学 数字 资源 建设 .系统 ”结构 化 数据 广 


(CHGIS) 


美 


国 波士顿 哈佛 大 学 


建设 


HET 
人 


[J]. 图 书 情报 工作 ,2021,65(24) :4 -17. 


(ENAT 


R2 25 个 未 参评 项 目 基本 情况 


编号 项 目 名 称 地 区 建设 机 构 学 科 项 目 类 型 资源 类 型 DE: 
XM27 ”中国 记忆 北京 。 国家 图 书馆 史学 数字 资源 建设 综合 广 
XM28 ”北京 记忆 北京 。 中 国人 民 大 学 史学 数字 资源 建设 综合 一 般 
XM29 ”国学 宝典 北京 ”首都 师范 大 学 文学 数字 资源 建设 结构 化 数据 文本 js 
北京 国学 时 代 文 化 传播 股 
份 有 限 公司 
XM30 ”丝绸 之 路 地 理 信息 系统 项 目 上 海 。 ”复旦 大 学 史学 数字 资源 建设 结构 化 数据 d 
XM31 ” 链 上 的 开放 知识 图 谱 联 盟 北京 “中国 中 文 信息 学 会 语言 与 ”图 书 情报 平台 与 工具 图 谱 js 
知识 计算 专业 委员 会 
XM32 “学术 地 图 发 布 平台 浙江 浙江 大 学 史学 数字 资源 建设 .平台 ”结构 化 数据 一 般 
美国 波士顿 哈佛 大 学 与 工具 
XM33 ”数字 敦煌 ES 敦煌 研究 院 史学 数字 资源 建设 结构 化 数据 、 图 片 一 般 
XM34 ” 清 季 职 官 表 查 询 系 统 台湾 ”台湾 大 学 史学 数字 资源 建设 结构 化 数据 d 
XM35 “台湾 百年 历史 地 图 台湾 Gp 史学 数字 资源 建设 结构 化 数据 d 
XM36 ”文化 资源 地 理 信息 系统 台湾 AW OPRIRE” 文学 .史学 数字 资源 建设 结构 化 数据 d 
RB? 中 华文 明之 时 空 基础 架构 “台湾 台湾 “中 央 研究 院 史学 数字 资源 建设 结构 化 数据 gs 
2» (CCTS) 
"ips 台湾 历史 文化 地 图 (THCTS) 台湾 AW OPRIRE” 史学 数字 资源 建设 结构 化 数据 d 
9 中国 历代 人 物 印 鉴 数据 库 浙江 ”浙江 图 书馆 艺术 数字 资源 建设 图 片 一 般 
ONYO 宋词 继 绻 , 何 处 画 人 间 浙江 ”浙江 大 学 文学 数字 资源 建设 结构 化 数据 文本 m 
© 北京 。 ”新 华 网 数据 新 闻 部 
1 九 歌 一 计算 机 古诗 作 诗 系统 。 ”北京 。 清华 大 学 文学 平台 与 工具 结构 化 数据 m 
qeu2 gp 北京 ” ”北京 师范 大 学 文学 数字 资源 建设 结构 化 数据 一 般 
Q0 中 国 地 方 历史 文献 数据 库 ( 自 — 上海 。 ”交通 大 学 史学 数字 资源 建设 文本 j^ 
CN zx 
GaBa 云南 省 古籍 数字 图 书馆 云南 。 云南 省 图 书馆 文学 数字 资源 建设 文本 广 
GA. 再 现 圆明园 北京 。 “北京 清华 城市 规划 设计 研 ”史学 数字 资源 建设 综合 aq 
> 究 院 
Xp 历史 人 文大 数据 平台 上 海 上 海 图 书馆 上 海 科学 技术 ” 史学 ,文学 数字 资源 建设 ,系统 文本、 结构 化 工具 je 
情报 研究 所 书 情报 建设 .平台 与 工具 
fi 也 方志 数据 库 计 划 德国 马克斯， 普 朗 克 科学 史 研 ”史学 平台 与 工具 结构 化 数据 d 
ume 究 所 
E a 
KMas 民国 时 期 期 刊 语料库 芝加哥 芝加哥 大 学 文本 光学 实验 室 。 史学 数字 资源 建设 结构 化 数据 .文本 d 
上 海 。 上海 图 书馆 上 海 科学 技术 
情报 研究 所 
XM49 ”中 国 历代 人 物 传记 资料 库 美国 波士顿 哈佛 大 学 费 正清 中 国 研究 ”史学 数字 资源 建设 结构 化 数据 p 
( CBDB) 中 心 “ 中 央 研 究 院 历史 语 
言 研究 所 ” 
北京 北京 大 学 中 国 古 代 史 研究 
中 心 
XM50 ”中 国 知 网 数字 人 文 研究 平台 北京 。 ”同方 知 网 北京 技术 有 限 公 ”图 书 情报 数字 资源 建设 .平台 ”综合 广 
司 与 工具 
XM51 ”上 古籍 整理 平台 北京 PEBH 文学 .史学 数字 资源 建设 结构 化 数据 广 


有 新 华 网 等 媒体 机 构 参 与 其 中 。 由 此 可 见 ,高 校 依 
旧 是 数字 人 文 项 目 建设 和 推行 的 “主力 军 ” ,科研 机 
构 和 公共 图 档 博 机 构 则 是 该 领域 建设 的 有 生 力 量 ， 
而 商业 机 构 让 数字 人 文 领域 主体 发 展 呈 现 跨行 业 、 
跨 机 构 的 新 态势 ,助力 数字 人 文 研 究 成 果 的 落地 扒 
广 。 男 外 需要 指出 的 是 , 越 来 越 多 的 高 校 ,如 北京 大 


FT 


学 武汉 大 学 .中国 人民 大 学 等 ,成 立 了 数字 人 文 研 
究 中 心 ,并 承担 起 了 项 目 建设 者 的 角色 ,对 数字 人 文 
项 目 进行 研究 和 孵化 ,这 些 中 心 的 建立 表现 出 高 校 
对 数字 人 文 这 门 交 又 学 科 的 重视 , 随 着 各 高 校 数字 


人 文 研究 中 心 的 逐步 建立 和 完善 ,将 来 必 将 涌现 H 
更 多 优秀 研究 项 目 。 
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图 1 国内 数字 人 文 项 目 建设 地 区 分 布 ( 含 合作 建设 机 构 ) 
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从 图 3 项 目 涉及 的 学 科 分 布 中 可 以 看 到 ,51 个 项 
目 中 有 24 个 项 目的 研究 对 象 是 历史 学 ( 占 比 47% ) 7 
个 项 目 是 文学 ( 占 比 13% ) .5 个 项 目 是 艺术 ( 占 比 
10% ) 。 由 此 可 见 ,历史 学 和 文学 仍然 是 数字 人 文 领域 
研究 的 热门 学 科 , 而 艺术 领域 则 是 数字 人 文 新 的 关注 
对 象 。 此 外 ,从 学 科 分 布 中 还 可 以 发 现 ,有 9 个 项 目 涉 
及 了 多 个 学 科 领 域 ,数字 人 文 研 究 在 人 文 研究 与 数字 
技术 的 跨 学 科 结合 中 起 到 了 融合 作用 。 最 后 ,值得 注 
意 的 是 , 跨 学 科 的 项 目 中 有 4 个 项 目 都 是 由 图 书 情报 
学 科 参 与 或 主导 ,可 见 图 书馆 和 图 情 系 是 数字 人 文 项 
目的 中 坚 力 量 。 


| = 史学 、 社 会 学 , 1, 2% 


图 3 数字 人 文 项 目 学 科 分 布 


3 数字 人 文 与 人 文学 科 : 数 字 人 文 项 目 
的 研究 对 象 

数字 人 文 项 目 是 数字 技术 在 人 文 领域 的 实践 与 融 
合 。 人 文学 科研 究 正在 向 以 数据 为 驱动 的 新 型 模式 转 
型 ,形成 “数字 人 文 "研究 新 范式 。 各 人 文学 科 领 域 


的 研究 者 和 研究 机 构 , 包 括 美 术 馆 、 档 案 馆 、 博 物 馆 
(GLAM) 等 文化 记忆 机 构 都 在 建设 数字 人 文 基础 设 
施 , 以 支撑 新 的 研究 范式 、 知 识 生 产 、 交 流 模式 。 数 字 
人 文 项 目 分 布 的 学 科 主要 为 历史 学 文学 .艺术 图书 情 
报 , 语 言 学 及 社会 学 等 ,本 文 根 据 各 个 项 目的 研究 内 容 
和 研究 对 象 ,结合 数字 技术 方法 ,对 数字 史学 .数字 文 


沈 立 力 , 张 宏 玲 , WAA, 等 . 汉语 语 境 下 数字 人 文 项 目 分 析 与 启示 
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学 数字 艺术 等 细 分 领域 的 研究 成 果 进 行 梳理 归纳 。 
3.1 历史 学 领域 

51 个 项 目 中 历史 学 领域 项 目 占 比 最 大 ,通过 对 项 
目 主 题 和 内 容 的 梳理 ,可 分 为 文化 遗产 数字 化 进程 、 史 
学 文献 数据 规模 化 和 语义 化 建设 .历史 时 空 史料 的 研 
究 和 应 用 3 个 方向 。 这 些 项 目 不 仅 为 传统 的 史学 研究 
带 来 了 新 技术 和 新 方法 ,也 深化 了 史学 研究 内 核 ,拓宽 
了 外 延 。 
3.1.1 文化 遗产 的 数字 化 进程 

2020 年 5 月 中 宣 部 在 《关于 做 好 国家 文化 大 数据 
体系 建设 工作 通知 》 中 明确 指出 要 “分 类 采集 梳理 文 


化 遗产 数据 ,对 全 国 公共 文化 机 构 高 等 科研 机 构 和 文 
化 生产 机 构 各 类 藏品 数据 ,标注 中 华 民 族 文化 基因 ,把 
非 物 质 文化 遗产 记录 成 果 中 蕴含 的 优秀 传统 文化 的 精 
神 标识 提炼 出 来 ”"” ,强调 了 数字 遗产 项 目 建设 的 重 
要 性 和 必要 性 。 国 内 文化 遗产 数字 化 的 项 目 很 多 , 文 
化 遗产 的 数字 化 工作 离 不 开 各 类 文化 机 构 及 社会 各 界 
的 共同 努力 。 此 次 项 目 征集 中 共有 5 个 项 目 涉 及 文化 
遗产 数字 化 主题 ,从 建设 机 构 文化 遗产 类 型 .主要 数 
字 资 源 .主要 技术 应 用 场景 5 个 角度 总 结 了 相关 特 
征 。 如 表 3 所 示 : 


RI 文化 遗产 数字 化 项 目 


项 目 名 称 建设 机 构 文化 遗产 类 型 主要 数字 资源 主要 技术 应 用 场景 
uif iE MPAUCE ”中 国人 民 大 学 ” 非 物 质 文化 遗 ”建筑 空间 视觉 资源 .数字 家 谱 ` 口 ”领域 本 体 、 命 名 实 ”前 站 后 库 ` 以 "记忆 高 迁 爱 得 我 所 ”门户 
记忆 网 站 数字 人 文 研究 ” 产 述 史 .照片 .捷报 、 门 大 要 联 绘画 ARA 网 站 作为 高 迁 乡土 文化 与 历史 知识 的 呈 
er 中 心 En EXER E 、 家 训 诵读 录音 现 窗 口 
[UE 270 敦煌 研究 院 萄 质 文化 遗 7 洞 写 信息 ,壁画 信息 . 音 视频 节目 VR 技术 、 高 清扫 ”构建 多 元 化 与 智能 化 相 结合 的 石 富 文物 
i 数字 化 资源 库 、 建 立 数字 资产 管理 系统 
描 数字 化 资源 局 数字 资产 管理 系统 和 
Cm 明 园 北京 清华 城市 ”物质 文化 遗产 。 考古 遗址 现场 记录 、 四 十 景 图 等 数 。” Re-relic 系统 .VR ”对 建筑 遗产 进行 虚拟 再 现 和 综合 信息 管 
JL YE EAE 当 案 历次 测绘 图 区 术 3D 全 景 建 ” 理 \ 文 撑 学 术 人 研究 考古 发 据 、 工程 、 
< 十 划 设 计 研 究 字 化 档案 .历次 测绘 图 技术 全 景 支撑 学 术 研 究 、 考 上 古 发 据 、 保 护 工程 
© 院 模 日 常 管理 \ 民 众 参与 
(跨国 记忆 国家 图 书馆 FE 物 质 文化 遗 ”口述 史料 .影像 史料 .手稿 .信件 、 专题 库 建设 整理 中 国 现 当代 重大 事件 .重要 人 物 专题 
N Je 照片 .实物 文献 ,形成 多 载体 、 多 种 类 的 专题 文献 资 
© 源 集合 
Akii 中 国人 民 大 学 非 物质 文化 遗 ” 图 片 . 地 方 文献 .资源 地 图 、 音 视频 ”专题 库 建 设 构建 和 呈现 “ 老 北 京 " 的 历史 魅力 与 “新 
里 人 文 北京 研究 jy 北京 ”的 精神 风貌 ,构建 数字 化 北京 记忆 
P Hè 专题 库 
uk 3 中 可 见 , 文 化 遗产 数字 化 项 目的 建设 主体 | 游览 等 新 的 文 旅 体验 ,从 而 达到 虚拟 还 原 .真实 展现 及 
既 牧 括 公 共 及 高 校 图 书馆 ,也 有 敦 烛 研 究 院 这 样 的 科 | 保护 传承 的 目的 。 


研 忱 构 。 文 化 遗产 数字 化 项 目 具 体内 容 依据 文化 遗产 
类 制 可 以 分 为 物质 文化 遗产 (包括 保护 型 历史 文物 . 历 
史 建 筑 和 人 类 文化 遗址 等 ) 和 非 物质 文化 遗产 (包括 
口头 传统 和 表现 形式 .表演 艺术 和 传统 手工 艺 等 ) 1。 
图 书馆 为 主导 的 文化 遗产 数字 化 大 多 侧重 于 非 物质 文 
化 遗产 的 数字 化 工作 ,具体 而 言 就 是 在 馆藏 资源 建设 
的 基础 上 对 特定 主题 资源 利用 命名 实体 识别 、 本 体 建 
设 .专题 数 据 库 建 设 等 技术 对 口述 史料 家谱、 音 视频 
资料 .手稿 .信件 等 非 物质 文化 踪 产 进行 建设 .组织 . 管 
理 , 保 存 、 利 用 ,从 而 达到 对 文化 习俗 .地 域 文化 .口头 
传承 ,精神 信仰 等 非 物 质 文化 遗产 的 记录 .保护 与 传承 
的 目的 。 而 科研 机 构 为 主导 的 项 目 则 大 多 是 对 物质 文 
化 遗产 进行 数字 化 加 工 , 通 过 VR/AR 技术 .高 清扫 描 、 
3D 全 景 建 模 、 地 图 绘制 等 技术 手段 对 文化 遗址 历史 
文物 .历史 建筑 ( 群 ) 等 有 形 的 文化 遗产 进行 测量 、 标 
记 . 拍 摄 ,并 且 进 一 步 通过 在 线 可 视 化 为 用 户 提供 云端 


相关 学 者 指出 文化 遗产 数字 化 项 目 存在 文化 性 、 
历史 传承 性 、 分 散 性 、 繁 杂 性 和 传播 性 5 个 专 指 特 
E^ 。 而 冯 惠 玲 也 在 高 迁 古 村 数字 记忆 项 目 中 指出 ， 
整体 性 、 跨 时 空 , 活 态 化 、 广 视 域 多维 叙事 .语义 化 、 传 
统 文本 的 数字 诠释 以 及 沉浸 式 是 当今 文化 遗产 数字 化 
项 目前 进 的 新 方向 。 文 化 遗产 数字 化 使 得 不 可 移动 文 
物 突破 物理 空间 和 地 域 局 限 ,走出 文物 本 体 环境 而 呈 
现 于 公众 ,以 虚拟 和 现实 相 结 合 .艺术 与 科技 相 融 合 方 
式 , 打 造 全 新 数字 文化 记忆 。 
3.1.2. ”史学 文献 数据 规模 化 与 语义 化 建设 

对 史学 文献 进行 大 规模 数字 化 加 工 ,并 在 此 基础 
上 进行 语义 化 处 理 是 数字 史学 建设 的 基础 性 工作 。 其 
主要 工作 是 将 分 散在 史料 中 的 人 名 、 地 名 、 物 产 名 A 
作 、 事 件 名 等 进行 标注 并 转化 为 结构 化 数据 ,从 而 形成 
大 规模 知识 库 和 数据 集 , 为 后 续 人 文学 者 的 地 理 空间 
分 析 、 社 会 网 络 分 析 和 文献 计量 分 析 等 工作 提供 数据 
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基础 。 例 如 香港 科技 大 学 李 中 清 康文 林 团 队 的 “中 国 
多 代 人 口 数 据 库 (CMCPD)”, 通 过 挖 气 和 建设 基于 户 
籍 和 族谱 等 中 国 历史 档案 资料 的 大 规模 历史 数据 库 ， 
实现 了 对 长 期 人 口 记录 和 跨越 多 世代 家 庭 变 化 的 追 
踪 。 台 湾 大 学 数字 人 文中 心 的 “ 清 季 职 官 表 查 询 系 
统 ”, 通 过 对 《 清 季 职 官 表 附 人 物 录 》 的 数字 化 ,构建 
了 涵盖 乾隆 SI 年 至 宣统 3 年 的 官职 .人 名 、 组 织 官 
制 、 上 下 属 关系 等 信息 的 数据 系统 。 上 海 交通 大 学 
图 书馆 建设 的 《中 国 地 方 历 史 文献 数据 库 》 收 录 约 35 
万 件 地 方 历史 文献 ,构建 了 规模 最 大 的 可 全 文 检索 
的 写本 文献 数据 库 。 上 海 图 书馆 建设 的 “家 谱 知 识 
服务 平台 ”通过 关联 数据 技术 和 知识 图 谱 技 术 提供 
了 丰富 的 语义 化 家 谱 数 据 , 同 时 结合 人 名 规范 库 、 地 
名表 历史 纪年 表 等 关联 开放 数据 ,建成 了 全 量 级 、 
组 粒度 .长 时 间 、 大 空间 ,数据 开放 的 全 球 性 家 谱 数 
K. 


历史 时 空 史料 的 研究 和 应 用 

历史 地 理 项 目 建设 是 史学 领域 数字 人 文 项 目的 另 
-全 研究 热点 。 此 类 项 目 往往 通过 结合 历史 史料 和 地 
BS 系统 技术 ( Geographie Information System, GIS ) 
辅助 历史 地 理 数字 化 地 图 的 构建 ,多 角度 揭示 并 模拟 
特 辜 时 空 序列 下 特定 历史 事件 的 演变 过 程 ,以 及 为 国 
尝 闪 关 课题 的 研究 提供 科研 地 理 数据 。 南 京 大 学 的 
“ 乔 训 地 区 侵 华 日 军 怀 安 所 的 AR 故事 地 图 "利用 CIS 


的 历史 资料 相 结合 , 制 成 南京 地 区 侵 华 日 军 慰 安 所 的 


3.2 文学 领域 

文学 领域 项 目 按照 对 数据 资源 数字 化 加 工程 度 可 
以 划分 为 文本 处 理 与 基础 语 料 建设 .文本 分 析 与 知识 
探索 两 个 方面 。 
3.2.1 文本 处 理 与 基础 语 料 建设 

在 文学 领域 ,数字 技术 应 用 最 直接 和 最 基础 的 工 
作 就 是 文本 的 数字 化 和 基础 语 料 数据 库 的 建设 。 从 项 
目 调研 中 发 现 ,古籍 文献 资料 数字 化 项 目 在 对 实体 文 
献 的 扫描 项 目 中 占 比 最 大 。 例 如 ,首都 师范 大 学 研发 
了 大 型 古籍 文献 全 文 检索 数据 库 《 国 学 宝典 》, 中 华 书 
局 古 联 公司 推出 的 古籍 整理 平台 聚合 了 一 系列 数字 古 
籍 产品 ,如 《中 华 善本 古籍 数据 库 》《 中 华文 史学 术 论 
车库》 等 。 而 云南 省 图 书馆 建设 的 云南 省 古籍 数字 图 
书馆 则 完成 从 宋朝 至 民国 时 期 刻本 、 抄 本 、 写 本 等 不 同 
版 本 的 古籍 数字 化 工作 。 
3.2.2. 文本 分 析 与 知识 探索 

在 对 文献 进行 文本 数字 化 加 工 的 基础 上 ,许多 项 
目 利用 知识 图 谱 、 文 本 分 析 、 全 文 自动 识别 等 技术 手 
段 ,将 文献 数据 转换 为 机 器 可 读 的 数据 ,并 对 文本 内 容 
进行 深层 次 挖 气 、 对 其 中 人 、 地 、 时 、 事 及 关系 进行 揭 
示 。 

在 诗词 领域 ,新 华 网 数据 新 闻 联合 浙江 大 学 可 视 
化 小 组 研究 团队 的 “宋词 总 缮 , 何 处 画 人 间 ” 项 目 以 
《全 宋词 ) 为 样本 ,通过 知识 图 谱 、 社 会 网 络 分 析 等 手 
段 构 建 完成 了 宋代 词 人 游历 路 线 图 、 宋 代词 人 生平 及 
所 处 年 代 图 谱 。 同 时 ,以 文本 分 析 进 行 《全 宋词 》 词 频 
统计 和 常见 意象 统计 ,为 宋词 赏析 提供 新 的 数据 化 角 


都 师范 大 学 历史 学 院 开发 的 “丝绸 之 路 历史 地 理 信息 
开放 平台 ”将 分 散 的 历史 文献 资料 提取 成 带 有 空间 属 
性 的 历史 数据 ,并 与 考古 资料 相 结 合 构建 了 涵盖 城镇 、 
交通 文化 .土地 坚 殖 生态 环 境 等 人 文 .科研 数据 的 可 
视 化 地 图 数据 库 ,为 国家 提供 了 丝绸 之 路 的 科研 信息 
咨询 数据 。 复 旦 大 学 侯 杨 方 团 队 的 "丝绸 之 路 地 理 信 
息 系 统 " 则 通过 WebGIS 复原 了 法 显 、 玄 上 取经、 高 仙 
芝 远 征 等 多 条 线路 ,并 对 沿线 的 古城 分 布 情况 进行 了 
标注 ,首次 实现 了 对 传统 丝绸 之 路 在 现代 公路 的 地 理 
y 置 上 的 精确 复原 。 此 外 ,台湾 地 区 “中 央 研 究 院 ”的 
“台湾 历史 文化 地 图 (THCTS) “文化 资源 地 理 信 息 系 
统 ”“ 中 华文 明之 时 空 架构 (CCTS)” 系列 项 目 都 是 利 
用 WebGIS 技术 将 400 年 来 台湾 历史 文化 .自然 资源 
的 地 图 信息 建立 在 一 个 时 空 应 用 框架 内 ,展示 台湾 地 
区 的 历史 发 展 和 环境 变迁 。 


E 


度 。 北 京师 范 大 学 的 “唐诗 别 苑 "平台 则 聚焦 唐 代 许 
人 及 其 作品 ,使 用 自然 语言 处 理 技术 实现 对 诗歌 主题 、 
情感 .诗人 的 大 规模 知识 挖掘 ,打造 基于 知识 图 谱 的 全 
唐诗 语义 检索 与 可 视 化 平台 。 男 外 ,清华 大 学 的 “ 九 
歌 一 一 计算 机 古诗 作 诗 系统 ” 则 是 采用 最 新 的 深度 学 
习 技术 ,结合 多 个 专门 设计 的 诗歌 生成 模型 ,基于 超过 
80 万 首 人 类 诗人 创作 的 诗歌 进行 训练 学 习 , 研 发 了 人 
工 智能 诗歌 写作 系统 ,引起 人 们 对 诗词 创作 的 兴 

在 近代 报刊 领域 ,芝加哥 大 学 文本 光学 实验 室 和 
上 海 图 书馆 合作 的 “民国 时 期 期 刊 语料库 ”通过 语义 
WR ,分 类 算法 和 文本 重用 等 技术 ,对 民国 时 期 部 分 期 
刊 进行 元 数据 搜集 、 主 题 标 引 及 文本 OCR 识别 工作 ， 
并 开发 出 相应 的 文本 分 析 研 究 工 具 , 为 人 文学 者 阅读 
和 分 析 大 规模 文献 提供 多 种 尺度 的 “透镜 ” ,以 达到 在 
远 读 和 细 读 的 交替 中 发 现 各 种 抽象 的 文化 模式 的 目 
的 。 而 上 海 图 书馆 开发 的 “历史 人 文大 数据 平台 ” 则 


10 


沈 立 力 , KES, WRA, F. 汉语 语 境 下 数字 人 文 项 目 分 析 与 启示 


[J]. 图 书 情报 工作 ,2021,65(24) :4 -17. 


EEPE AE e EE 


RARR HR EB KR TP SER E R o 
源 , 利 用 关联 数据 、 知 识 图 谱 、F、 机 器 学 习 、GIS 等 新 
技术 支撑 计量 统计 文本 分 析 、 社 会 网 络 关系 分 析 、 时 
2 4r 3D 建 模 等 众多 数字 人 文 研究 方法 和 范式 , 支 
撑 不 同人 文学 科研 究 的 知识 交流 模式 和 应 用 场景 。 

在 古籍 领域 ,上 海外 国语 大 学 建设 的 "中国 古籍 基 
础 数据 分 析 平 台 ” 在 汇集 古籍 文字 文本 词典 典籍 知 
识 等 中 国 古 籍 基础 数据 基础 上 为 人 文学 者 研究 提供 文 
本 分 析 工 具 和 中 国 存世 典籍 的 目录 检索 和 知识 图 谱 服 
务 。 华 东 师 范 大 学 调查 与 数据 中 心 建设 的 “融合 机 器 
智能 与 群体 智慧 的 古籍 数据 化 实践 ”项目 则 是 通过 人 
工 智 能 技术 在 数字 人 文中 的 应 用 和 众 包 协作 模式 , 提 
供 古籍 全 文 自动 识别 、 自 动 句 读 、 图 文 自动 标 引 等 古籍 


个 栏目 的 引言 和 入 口 ,表现 出 更 强 的 陈列 感 ,能 够 有 效 
地 避免 其 他 栏目 的 信息 干扰 ,为 访客 提供 沉浸 式 的 济 
览 体验 ,让 观众 能 够 迅速 融入 到 古色 古韵 的 古村 落 文 
化 氛围 中 。 上 海 图 书馆 设计 开发 的 “历史 人 文大 数据 
平台 "也 同样 采用 了 全 屏 网 页 结构 ,并 在 首页 插入 视频 
动画 ,使 首页 的 展示 更 加 直观 和 富有 律动 。 同 时 ,采用 
多 屏 下 拉 的 方式 向 用 户 展 示 海 派 品 牌 .电影 记忆 、 红 色 
旅游 等 多 个 故事 性 场景 ,循环 且 动 态 地 向 用 户 展示 历 
史 人 文大 数据 平台 丰富 的 资源 内 容 和 特色 ,交互 体验 
贯穿 整个 故事 性 场景 的 浏览 输入 、 输 出 过 程 。 
3.3.3” 印 藏 .壁画 \ 书 画 的 数字 化 呈现 

在 本 次 项 目 分 析 中 发 现 ,数字 人 文 技术 在 书画 、 印 
藏 等 传统 艺术 领域 有 所 作为 ,为 这 些 领域 的 知识 组 织 


数据 化 工作 中 需要 用 到 的 方法 和 工具 。 中 南 民族 大 学 
开发 的 “ 唐 宋 文学 编 年 地 图 ”项目 则 是 解决 了 中 国 古 

学 研究 中 长 期 存在 的 “资料 离散 "和 “时 空 分 离 ” 
= 题 ,并 首次 提出 “ 系 地 ”概念 ,实现 了 文学 信息 


J 在 对 51 个 项 目 分 析 中 发 现 数字 人 文 在 艺术 领域 
逐 汤 发 挥 作用 。 印 藏 ,壁画 ,书画 的 数字 化 旦 现 为 人 文 
区 和 研究 提供 了 极 大 便利 。 同 时 , 越 来 越 多 的 数字 人 
文 横 目 开始 更 多 关注 数据 可 视 化 呈现 和 视觉 传达 。 
3K 数据 可 视 化 


方式 和 展现 形式 带 来 了 新 方向 。 上 海 博物 馆 开发 建设 
的 董 其 昌 数 字 人 文 展 示 系 统 首次 将 机 器 学 习 引 入 书画 
研究 ,依靠 数据 关联 和 量化 分 析 ,以 可 视 化 的 形式 展现 
了 与 董 其 昌 相 关 的 时 、 地 、 人 、 事 ,实现 书画 精 看 ,还 原 
了 一 个 以 董 其 昌 为 中 心 而 构筑 的 晚 明 时 代 的 艺术 生态 
圈 , 是 对 博物 馆 数 据 可 视 化 的 新 尝试 。 复旦 大 学 建设 
的 “ 印 藏 :复旦 大 学 印 谱 文 献 虚 拟 图 书馆 "引入 国际 图 
像 互 操作 框架 (TInternational Image Interoperability 
Framework ,IIF ) ,采用 Serverless 架构 ,构建 高 性 价 比 
的 大 规模 图 片 资源 服务 ,重新 组 织 并 展示 了 人 金石 学 者 
松 荫 轩 主人 林 章 松 的 印 藏 藏品 。 华 东 师 范 大 学 建设 的 
“中 国 近 现代 书画 印 本 数据 库 ” 则 是 以 图 像 资源 为 主 


忆 数 据 可 视 化 是 现代 科技 与 人 文艺 术 融 合 发 展 的 产 


要 建设 对 象 ,运用 LIE ,关联 数据 等 技术 手段 ,在 展示 


物 = 随 着 数字 技术 的 发 展 , 图 像 和 数据 的 结合 形式 产生 
了 医 化 ,并 得 到 了 发 展 。 数 据 可 视 化 也 为 数字 人 文 令 
域 的 研究 提供 了 新 视角 。 清 华 大 学 向 帆 团 队 设计 建设 
的 中 国 古 代 皇 室 家 族 树 ( 赵 宋 、 李 唐 . 朱 明 ) 以 中 国 古 
代 人 物 关系 数据 库 ( CDBD) 中 的 家 族 关系 数据 为 基 


ERE 、 冯 超然 等 书画 名 家 的 作品 的 同时 ,提供 了 内 容 
注释 智能 推荐 .时 空 分 析 等 书画 作品 欣赏 \ 研 究 的 新 
功能 。 武 汉 大 学 开发 及 建设 了 两 个 基于 敦煌 壁画 主题 
的 项 目 。 一 是 “基于 IF 的 敦煌 壁画 数字 叙事 系统 ”， 
二 是 “ 敦 烛 壁画 主题 词 表 及 关联 数据 发 布 服务 平 台 ”。 


础 ,运用 算法 和 可 视 化 手段 将 个 人 家 族 关 系 进行 相互 
判断 、 连 接 , 并 按时 间 顺 序 构成 生长 的 家 族 树 , 从 中 发 
现 血 脉 关系 中 的 疑点 。 中 国 古 代 皇 室 家 族 树 的 构建 工 


前 者 是 以 敦煌 莫 高 富 第 61 窟 中 知名 的 《五 台山 图 》 壁 
画 为 案例 ,利用 MF 技术 手段 ,引入 数字 叙事 的 理念 ， 
从 人 .\ 事 时 、 地 、 物 五 个 维度 对 壁画 中 的 概念 与 实体 进 


作 既 揭示 了 历史 中 大 型 家 族 的 内 部 特征 ,又 提出 了 不 
同 于 传统 视觉 的 新 问题 。 
3.3.2 视觉 传达 与 用 户 体验 

一 些 数字 人 文 项 目 除了 在 数据 可 视 化 领域 有 新 的 
尝试 ,在 视觉 传达 和 用 户 体验 方面 也 不 断 吸收 先进 UI 
设计 理念 ,以 起 到 更 明确 揭示 项 目 主题 ,更 舒适 交互 体 
验 ,更 清晰 演绎 数据 模型 .更 直观 视觉 化 转化 的 作用 。 
中 国人 民 大 学 的 “高 迁 古 村 数字 记忆 网 站 "首页 采用 
国内 比较 少见 的 全 屏 网 页 结构 ,每 屏 只 向 观众 展示 一 


行 解构 和 场景 揭示 。 而 后 者 则 是 构建 了 一 个 规范 .全 
面 的 敦煌 壁画 领域 主体 词 表 ,为 敦煌 壁画 数字 资源 的 
深度 语义 标注 .知识 组 织 ,信息 关联 与 共享 等 提供 一 套 
受 控 词 表 , 促 进 了 敦煌 壁画 数字 人 文 应 用 的 开发 。 
3.4 图 书 情报 领域 与 相关 交叉 学 科 

本 次 数字 人 文 的 很 多 项 目 都 是 图 书 情报 学 科 领 域 
内 的 专家 以 及 公共 图 书馆 、 高 校 图 书馆 博物 馆 等 图 情 
机 构 主 导 , 这 些 专家 和 图 情 机 构 承 担 着 推动 数字 人 文 
基础 设施 建设 及 发 展 的 重任 ,数字 人 文 自然 也 成 为 
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情 领域 的 研究 热点 ,同时 也 催生 了 图 情 学 科 与 其 他 学 
科 之 间 的 跨 学 科 交 叉 课题 项 目 出 现 。 
3.4.1 图 博 档 领 域 

图 书馆 .博物 馆 .档案 馆 作 为 伴随 人 类 文明 进步 的 
公共 文化 记忆 机 构 , 有 着 保护 文化 遗产 ,保存 与 提供 信 
息 资源 等 天 然 使 命 “。 因 此 ,数字 人 文 项 目的 不 断 推 
进 在 图 书 情报 领域 进行 了 大 量 的 基础 数据 积累 .综合 
性 工具 平台 建设 以 及 数字 人 文教 育 工具 构建 。 在 基础 
数据 积累 方面 ,复旦 大 学 建设 的 “多 源 异 构 学 术 成 果 大 
数据 的 融合 与 揭示 项 目 "提出 的 学 术 成 果 大 数据 的 解 
决 方案 包括 从 数据 获取 到 清洗 再 到 关联 挖 气 及 展示 的 
全 程 处 理 机 制 ,设计 建立 可 对 关键 环节 实现 人 工 校准 
机 制 的 交互 式 数据 清理 流程 。 上 海 图 书馆 的 “SinoPe- 
dig7 关 联 数据 服务 平台 ”降低 了 关联 数据 使 用 的 技术 
] 枕 ,通过 便捷 的 文件 配置 方式 实现 多 数据 集 的 语义 
B9 ( SO00PA) 、 数据 发 布 (Linked Data Publishing, 
tpi 和 图 谱 呈 现 (Linked Data Visualization, LDV) 。 最 
局 学 科 服务 是 图 书馆 支撑 学 科 建设 的 基础 服务 , 因 
此 s 主 数字 人 文 的 背景 下 ,华东 师范 大 学 的 分 布 式 数字 
上 民 芝 研究 与 教学 实 训 环境 以 数字 方志 为 研究 内 容 ,将 
资源 与 研究 工具 .研究 方法 .教学 训练 .方法 学 习 等 集 
了 到 个 逻辑 平台 上 ,构建 分 布 式 数字 人 文 研究 与 教学 
实 训 环 境 。 
MESE 
>< 数 字 人 文本 身 就 是 一 个 交叉 学 科 , 图 情 领域 研究 
者 算数 字 人 文 与 其 他 学 科 之 间 的 沟通 桥梁 ,数字 人 文 


项 目的 开发 研究 采取 其 他 学 科 的 项 目 课题 基础 数据 
和 技术 手段 ,搭建 了 跨 学 科 的 数字 人 文平 台 。“ 战 疫 中 
的 复旦 "专题 数字 特 藏 平台 是 复旦 大 学 图 书馆 正在 开 
发 的 项 目 , 旨 在 全 面 收 集 \、 保 存 、 整 理 和 展示 全 校 各 领 
域 在 战 疫 期 间 形 成 的 各 类 史料 ,从 医学 的 角度 开发 和 
整合 各 类 战 疫 专题 资料 并 建立 数字 特 藏 平台 。 复 旦 大 
学 的 东亚 语言 数据 中 心 将 语言 学 与 数字 人 文学 科 相 结 
合 , 对 海量 语 料 进行 数字 化 ,结合 大 数据 与 地 理 信息 系 
统 等 数字 人 文 方法 ,建立 了 国内 最 大 规模 、 免 费 公开 、 
面向 学 术 研 究 的 方言 语料库 。 


4 技术 手段 与 方法 应 用 :数字 人 文 项 目 
的 研究 方法 


学 科 的 发 展 离 不 开 科学 技术 的 支撑 , 随 着 数字 人 
文 研究 对 象 的 多 样 化 和 研究 内 容 的 跨 学 科 性 发 展 特 
点 ,数字 人 文 研究 在 收集 、 发 现 、 协 作 、 比 较 、 发 布 等 阶 
段 都 离 不 开 文本 分 析 、 社 会 网 络 分 析 、 空 间 分 析 、 自 动 
分 类 互动 测量 等 技术 手段 的 交叉 使 用 。 数 字 人 文 研 
究 按 技术 类 型 可 以 分 为 数字 化 技术 .数据 管理 技术 t 
据 分 析 技 术 、 可 视 化 技术 、VR/AR 技术 、 机 器 学 习 技术 
等 "; 。 这 些 技术 实现 了 数字 人 文 项 目的 基础 资源 加 
工 \ 服 务 系统 构建 \ 应 用 平台 构造 直观 形象 呈现 交互 
环境 打造 以 及 智慧 服务 提供 。 表 4 是 本 次 51 个 数字 
人 文 项 目 采 用 的 方法 和 技术 统计 情况 : 


表 4 数字 人 文 项 目 方法 和 技术 


ee 


CERRAH 具体 方法 与 技术 项 目 名 称 
数字 化 技术 。 ”扫描 ,拍摄 ,3D 建 模 .高 清扫 描 。 ”数字 敦煌 ,中 国 地 方 历史 文献 数据 库 ( 奖 约 文书 ) ,云南 省 古籍 数字 图 书馆 .再现 贺 明 园 .南京 地 区 侵 华 
日 军 奈 安 所 的 AR 故事 地 图 
数据 管理 技术 本 体 构建 .数据 库 设计 、 命 名 实 《中 国 历史 人 物资 料 库 》(CBDB) 在 线 查 询 系 统 第 二 版 一 面向 用 户 需求 的 重新 设计 与 实现 .融合 机 器 知 
体 识别 .语义 搜索 .API 数据 服 ”能 与 群体 智慧 的 古籍 数据 化 实践 、 分 布 式 数字 人 文 研究 与 教学 实 训 环境 敦煌 壁画 主题 词 表 及 关联 数据 
务 .语义 描述 发 布 服务 平台 、 家 谱 知 识 服务 平台 、SinoPedia :关联 数据 服务 平台 中国 知 网 数字 人 文 研究 平台 历史 人 文 
大 数据 平台 、 地 方志 数据 库 计 划 、 民 国 时 期 期 刊 语料库 ,中国 历 代 人 物 传记 资料 库 (CBDB) 
数据 分 析 技 术 文本 分 析 \ 内 容 挖 所 .地 理 信息 。” 唐 宋 文学 编 年 地 图 董 其 昌 数 字 人 文 展示 系统 .六朝 建 康 城市 历史 信息 系统 .南京 地 区 侵 华 日 军 奈 安 所 
系统 ,社会 网 络 关系 的 AR 故事 地 图 ,方志 物产 知识 库 构建 及 深度 利用 研究 ,中国 近 现代 书画 印 本 数据 库 丝绸 之 路 地 理 信 
息 开 放 平 台 , 家 谱 知 识 服务 平台 ,北京 记忆 .学 术 地 图 发 布 平台 台湾 百年 历史 地 图 .文化 资源 地 理 信息 
系统 ,台湾 历史 文化 地 图 (THCTS) ,唐诗 别 苑 .历史 人 文大 数据 平台 、 中 国 历代 人 物 传记 资料 库 (CB- 
DB) “ 战 疫 中 的 复旦 "专题 数字 特 藏 平台 
可 视 化 技术 知识 地 图 ,场景 模拟 、 信 息 美学 ”台大 数字 人 文中 心 建构 之 数字 人 文 分 析 系统 与 个 人 DH 研究 平台 “ 战 疫 中 的 复旦 "专题 数字 特 藏 平 
台中 国 古 籍 基础 数据 分 析 平 台 、 打 元 学 案 知识 图 谱 可 视 化 系统 ,家 谱 知 识 服务 平台 ,中 国 古 代 皇 室 家 
族 树 ( 赵 宋 ` 李 唐 、 朱 明 ) ,宋词 继 绻 , 何 处 面 人 间 .、 唐 诗 别 苑 ,历史 人 文大 数据 平台 ,历史 文化 名 人 游学 
足迹 知识 图 谱 的 构建 与 可 视 化 , 链 上 的 开放 知识 图 谱 联 盟 
VR/AR 技术 。 ”虚拟 现实 技术 、 增 强 现实 技术 、 数字 敦 烛 .再 现 圆明园 .南京 地 区 侵 华 日 军 怀 安 所 的 AR 故事 地 图 .北京 记忆 
游戏 化 学 习 
机 器 学 习 技术 。 深度 学 习 、 自 动 分 类 ,个 性 化 服 。 方志 物产 知识 库 构建 及 深度 利用 研究 .历史 人 文大 数据 平台 “ 战 疫 中 的 复旦 "专题 数字 特 藏 平台 , 唐 


务 诗 别 苑 、 九 歌 一 一 计算 机 古诗 作 诗 系统 
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从 表 4 可 以 发 现 当前 数字 人 文 项 目 较 多 聚焦 于 数 


极 具 特色 的 馆藏 文献 ,将 大 规模 \ 全 量 级 多 种 类 的 文 


据 管 理 技 术 、 数 据 分 析 技 术 和 可 视 化 技术 三 个 类 型 。 
换 而 言 之 ,目前 数字 人 文 项 目 关 注 的 重点 已 经 从 单纯 
的 基础 资源 建设 迈 向 数字 人 文 服务 系统 、 应 用 平台 和 


献 资 源 汇 聚 在 一 起 ,与 人 、 地 、 时 、 事 等 语义 知识 库 关 
联 , 建 设 数据 基础 设施 、 形 成 多 重 参 照 体系 ,为 研究 者 
提供 发 现 新 闻 题 的 “沃土 " .解决 老 问 题 的 “新 工具 ”。 


直观 形象 的 构建 ;从 初期 的 数据 收集 和 发 现 阶段 发 展 
成 为 对 数据 的 收集 .发现 .协作 、 比 较 和 发 布 阶段 。 这 
符合 数字 人 文 研 究 的 一 般 生 命 周期 ,也 意味 着 信息 技 
术 以 不 同形 式 深度 参与 数字 人 文 研 究 的 不 同 阶段 , 提 
供 了 数字 人 文 研究 所 需 的 资源 工具、 技术 和 交流 平 
台 。 

其 次 ,从 表 4 中 可 以 发 现 越 来 越 多 的 数字 人 文 项 
目 已 经 不 单单 运用 某 一 类 型 的 技术 或 是 建设 某 一 方面 
的 资源 类 型 ,而 是 逐步 发 展 为 多 资源 、. 多 角度 .多 方法 、 
务 领 域 的 综合 性 工具 与 研究 平台 , 旨 在 为 人 文 专家 提 


供 锭 字 人 文 研究 的 技术 支持 和 解决 方法 ,在 解决 传统 


人 学 科 问 题 的 同时 ,也 鼓励 他 们 使 用 平台 提供 的 技 
泣 工 具 用 非 人 文 领域 研究 方法 来 理解 和 分 析 自 有 的 
Nick ,并 通过 工具 集成 平台 分 享 研究 成 果品 。 例 如 ， 
中 畏 中 文 信息 学 会 语言 与 知识 计算 专业 委员 会 主办 的 
E 的 开放 知识 图 谱 联 盟 (Open Knowledge Graph, 
Open KG ) ”是 知识 图 谱 数 据 集 的 开放 共享 平台 ,为 用 户 
所 而 数据 库 API 接口 ,检索 查询 系统 、 预 训练 模型 等 工 
碟 负 ,帮助 用 户 构建 自己 的 知识 图 谱 数据 。 上 海 图 书 
馆 奖 “历史 人 文大 数据 平台 "利用 语义 网 ,关联 数据 、 
RENK DLE CIS .可 视 化 等 新 技术 ,集合 古籍 、 
家 说 名 人 档案 手稿,. 近 现代 图 书 报纸 .期刊 资源 等 


同方 知 网 北京 技术 有 限 公 司 建设 的 “中 国 知 网 数字 人 
文 研究 平台 ”也 是 整合 了 知 网 多 种 文献 资源 和 用 户 自 
有 资源 ,通过 文献 计量 分 析 、 文 本 挖掘 分 析 、 可 视 化 呈 
现 、 知 识 图 谱 构 建 等 研究 工具 ,满足 人 文 研究 学 者 的 需 


5 数字 人 文 与 基础 设施 建设 :数字 人 文 
项 目的 类 型 分 析 


上 海 图 书馆 刘炜 研究 员 等 认为 数字 人 文 基础 设施 
是 一 种 支持 人 文科 研 活动 的 基础 设施 ,是 在 数字 环境 
下 为 开展 人 文 研究 而 必须 具备 的 基本 条 件 。 数 字 人 文 
基础 设施 可 以 分 为 3 个 层次 ,其 核心 是 文献 资源 和 其 
服务 机 构 组 成 ,提供 了 基本 研究 素材 的 保障 ;中 间 层 是 
数字 人 文 研究 活动 的 主体 ,由 系统 平台 、 工 具 与 软件 、 
数据 资源 建设 仓储 .基金 会 .领域 专家 和 数据 科学 家 等 
构成 ;外 围 是 数字 人 文 研 究 的 成 果 发 布 平台 ,与 学 者 、 
HP! 、 社 会 产生 交互 ,包括 数据 发 现 平 台 、 可 视 化 平台 、 
交流 平台 、 开 放出 版 平台 等 ” 。 基 于 数字 人 文 基 础 设 
施 “ 三 层次 ”构成 论述 ,51 个 项 目的 层次 模块 的 详细 分 
布 归属 如 表 5 Bron: 


LL 


Cm 


= R5 数字 人 文 项 目 基于 基础 设施 建设 的 类 型 分 析 

Q 层次 模块 项 目 (编号 ) 

核心 层 大 学 .研究 所 、 图 档 博 等 机 构 组 织 XM01-XM51 的 建设 机 构 

中 间 层 系统 平台 XMO1 ,XM04 ,XM05 .XMI11 XM13 ,XMI4 ,XMI5 ,XM16 ,XM18 ,XM23 ,XM26 ,XM31 ,XM47 


数据 资源 机 构 仓储 


计算 设施 
领域 专家 / 
金 会 / 


基 

管理 工具 
H 

数 

S 


XMOS XM24 XM41 


XM02 , XM03 , XM04 、XM06-XM12 、XM14 、XM17 , XM19-XM22 、XM25-XM30 , XM32-XM4O , XM42- 
XM45 XM48 ,XM49 


XMOS XMIS XM23 XM24 XM31 XM32 XMS1 


外 围 层 视 化 呈现 平台 XMO3 XM25 ,XM46,XM50 
居 分 析 平 台 XM46,XM50 
S 交流 平台 / 
放 语义 出 版 平台 1 


从 表 5 中 可 以 发 现 ,51 个 数字 人 文 项 目 涉 及 了 基 
础 设施 建设 的 方方面面 且 各 有 侧重 ,而 这 些 数字 人 文 
项 目的 工作 同样 也 推动 了 基础 设施 的 建设 ,3 个 层次 
多 个 模块 因素 的 相互 作用 形成 了 一 个 可 持续 发 展 的 有 


机 整体 ,并 且 呈 现 以 下 3 个 特征 : 

(1) 数字 人 文 基础 设施 建设 仍然 处 于 “ 积 演 ” 阶 
段 。 本 次 会 议 的 主题 是 “ 积 演 与 超越 ” ,而 目前 数字 人 
文 设施 建设 也 正 处 于 “积淀 ”阶段 。 数 字 人 文 基础 设 
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施 建 设 是 一 个 长 期 过 程 ,目前 汉语 语 境 下 的 基础 设施 
建设 仍然 存在 不 足 , 绝 大 部 分 的 项 目 主体 类 型 是 数字 
资源 建设 .系统 建设 、 平 台 与 软件 开发 。51 个 项 目 中 
40 个 项 目 是 以 数字 人 文 为 导向 的 资源 数据 库 建设 , 资 
源 数据 库 的 建设 即 包 括 将 非 数字 化 的 人 文 资料 加 工 转 
化 为 数字 内 容 , 也 包括 将 非 结 构 化 的 数字 文本 内 容 按 
照 某 种 使 用 目的 进行 规范 化 标注 著录 的 数据 集 建设 。 
加 工 建设 的 资源 类 型 可 分 为 图 像 文本 型 . 音 视频 以 及 
结构 化 数据 ;19 个 项 目 涉及 系统 建设 和 平台 软件 的 开 
发 ,例如 北京 大 学 主持 的 “《 中 国 历史 人 物资 料 库 》 
(CBDB) 在 线 查询 系统 第 二 版 一 面向 用 户 需求 的 重 
a eb E uds he 
成 果 大 数据 的 融合 与 揭示 ”项 目 等 (deine 
WEO HERI BS A CUP A” duds 
20 9 ou» i 
EO A ek HUE RCRT D GR .不断 优化 .可 
TERRIA LAE V c UL CRINE DUBHEHBE FAFA 
SEMEEI W Fe" 的 基础 上 进行 超越 的 方向 。 
PCO) 数据 资源 及 机 构 仓储 建设 是 基础 设施 建设 中 
IDAMAA. TER 40 个 涉及 数字 资源 数据 库 建设 
HA 22 个 项 目的 数字 资源 内 容 覆盖 面 较 罕 , 属 
了 本 癌 资源 的 数字 化 建设 , 即 专题 数据 库 的 建设 。 专 
的 建设 对 象 往往 是 某 一 特定 领域 或 特定 主题 的 数 
ERI, 往往 是 以 某 一 部 馆藏 典籍 为 基础 ,或 是 某 一 特 
移 到 中 时 期 、 历 史 事件 为 主题 进行 相关 资源 的 数字 化 
与 赂 据 化 建设 与 服务 。 例 如 ,南京 农业 大 学 的 “方志 
产 短 识 库 构建 及 深度 利用 研究 ” 项 目 是 对 约 3000 RH 
学 四 (方志 物产 ) 进 行 了 数字 化 和 语义 化 加 工 , 构 建 涵 
盖 词 汇 . 术 语 、 关 键 词 .命名 实体 、 时 空 ARTA 
北京 大 学 数字 人 文 研究 中 心 开 发 的 “ 宋 元 学 案 知 识 图 
谱 可 视 化 系统 " 则 是 从 遥 读 、 精 读 两 个 角度 对 《 宋 元 学 
案 》 这 部 理学 巨著 进行 深度 挖掘 和 分 析 ,讲述 宋代 师承 
和 学 术 思 想 演变 过 程 。 南 京 大 学 的 “六 朝 建 康 城市 历 
史 信 息 系 统 ”以 六 朝 时 期 的 建 康 ( 今 南京 ) 为 时 空 研究 
范围 ,建立 了 完整 的 六 朝 建 康 历史 地 理 数据 库 。 

(3) 数字 人 文 基础 设施 建设 是 “使 能 者 "5 。 虽 
然 未 收集 到 51 个 项 目的 基金 赞助 情况 ,但 是 刘炜 
等 5 指出 各 类 基金 会 是 数字 人 文 基础 设施 建设 的 重 
要 推动 力量 ,同时 其 自身 也 是 基础 设施 建设 的 一 部 分 。 
而 国内 也 有 越 来 越 多 的 数字 人 文 项 目 得 到 了 “国家 社 
科 基 金 "“ 教 育 部 哲学 社会 科学 研究 基金 "等 资助 ,从 
而 也 吸引 到 更 多 的 领域 专家 参与 到 数字 人 文 项 目的 建 
设 中 来 。 此 外 ,大 学 .研究 所 和 图 档 博 等 机 构 作 为 基础 


设施 建设 的 核心 因素 ,纷纷 成 立 数字 人 文 研究 中 心 , 并 
以 此 为 建设 主体 主持 开发 数字 人 文 项 目 , 例 如 人 民 大 

主持 的 “高 迁 古村 数字 记忆 项 

”武汉 大 学 数字 人 文 研究 中 心 主持 的 “基于 IF 的 
es 
主持 的 “ 宋 元 学 案 知 识 图 谱 可 视 化 系统 ” ,上海 图 书馆 
的 历史 人 文大 数据 平台 等 。 这 些 机 构 在 做 好 保障 基本 
研究 资料 的 基础 上 为 各 类 人 文 研究 项 目 提供 了 数据 共 
享 、 机 构 协 作 、 人 员 培 训 的 协助 ” ， ee 开放 
获取 、 共 建 共享 .学科 融合 发 展 提供 渠道 和 平台 ,推动 
人 文 社会 科学 的 定 i: 


6 服务 模式 与 问题 解决 :数字 人 文 项 目 
的 现实 意义 


在 2020 年 数字 人 文 年 会 的 专家 辩论 环节 ,专家 们 
一 致 认为 数字 人 文 基础 设施 建设 不 能 取代 人 文科 学 本 
身 的 研究 ,数字 人 文 基础 设施 建设 存在 的 意义 是 推动 
人 文 研究 的 发 展 ”。 从 上 面 分 析 可 以 看 出 ,目前 汉语 
语 境 的 数字 人 文 项 目 工 作 基 本 都 还 是 属于 基础 设施 建 
设 范畴 ,也 就 是 说 数字 人 文 项 目 通过 为 数字 人 文学 者 
力 至 传统 人 文学 者 解决 科研 中 的 实际 问题 ,提供 资源 
素材 保障 及 工具 平台 计算 设施 服务 ,从 而 推动 人 文 研 
究 的 发 展 ,实现 其 现实 意义 ,主要 体现 在 以 下 3 个 方 
面 : 

(1) 数 字 人 文 项 目 解决 学 者 基本 研究 素材 保障 、 
数据 处 理 和 软件 学 习 的 实际 问题 。 目 前 ,很 多 人 文学 
者 在 做 研究 时 在 数据 收集 处 理 和 软件 技术 的 学 习 上 兹 
费 大 量 时 间 ,项 目 中 大 量 涉及 数字 资源 建设 和 工具 软 
件 开发 ,这 些 都 可 以 为 学 者 提供 基本 的 研究 素材 ,帮助 
他 们 进行 数据 加 工 处 理 ,将 学 者 从 繁复 的 资料 整理 及 
数据 处 理 的 工作 中 解脱 出 来 ,更 好 投入 到 本 学 科 领 域 
的 研究 中 ,提高 研究 效率 ,促进 学 科 发 展 。 此 外 ,吸引 
人 文学 者 一 起 参与 数字 人 文 项 目 工作 就 可 以 在 项 目的 
各 个 阶段 充分 了 解 人 文 研究 工作 的 需求 ,建设 更 符合 
人 文 研究 学 者 需要 的 资源 数据 库 、 工 具 软 件 和 系统 平 


Z» 
Ho 


(2) 数 字 人 文 项 目 提供 学 者 开放 数据 应 用 、 个 性 
化 研究 支持 的 服务 。 一 方面 ,一 些 项 目 开 发 的 工具 或 
平台 建设 的 开放 数字 资源 可 以 被 其 他 项 目 利 用 和 进 
一 步 开 发 .优化 ,完成 数字 资源 建设 的 不 断 欠 代 , 有 效 
促进 信息 资源 的 二 次 利用 ,创造 出 新 的 “数据 价值 ”， 
为 人 文学 者 提供 基于 “数据 驱动 " 的 服务 。 例 如 上 海 
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沈 立 力 , KES, 韩 春 过 ,等 . 汉语 语 境 下 数字 人 文 项 目 分 析 与 启示 
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大 学 的 “历史 文化 名 人 游学 足迹 知识 图 谱 的 构建 与 可 
视 化 "项 目 、 清 华 大 学 的 “中 国 古代 皇室 家 族 树 ( 赵 宋 、 
李 唐 、 朱 明 ) "等 项 目 都 是 利用 已 有 开放 数据 的 成 果 进 
行 艺术 和 历史 领域 的 再 研究 ,两 个 项 目 都 在 研究 中 引 
入 CBDB 的 人 物 数据 ,让 传统 的 历史 人 文 研究 焕发 新 
光彩 ,也 为 艺术 .历史 领域 人 文学 者 提供 新 理念 和 新 角 
度 。 另 一 方面 ,一 些 平台 和 系统 支持 人 文学 者 的 个 性 
化 研究 ,进行 处 理 数据 、 建 数据 库 ,结合 不 同 来 源 的 工 
具 与 数据 集 等 工作 。 例 如 ,台湾 大 学 的 “台大 数字 人 文 
中 心 建构 之 数字 人 文 分 析 系 统 与 个 人 DH 研究 平台 ” 
就 提供 工具 处 理 个 人 资料 .一 键 建立 数据 库 、 分 析 与 可 
视 化 工具 及 个 人 语料库 服务 “复旦 大 学 东亚 语言 
据 中 心 "项 目 开发 的 自 定义 语言 条 件 语言 地 理 信息 查 
询 s 用 户 上 传 数 据 制图 系统 等 都 满足 了 专家 学 者 的 个 
性 你 使 用 需求 。 这 些 平台 和 系统 极 大 方便 了 研究 者 的 
各 全 活动 ,为 人 文 研究 学 者 提供 一 系列 人 文学 科 领 域 
三 关 的 资源 .工具 和 服务 ,帮助 学 者 建立 个 人 学 术 档 
守 使 平台 成 为 分 享 和 传播 数字 人 文 信息 的 桥梁 ,满足 
人 这 学 者 研究 的 多 样 性 需求 。 

3 ) 数 字 人 文 项 目 具有 助力 新 文科 建设 .促进 中 
生化 传承 的 现实 意义 。 一 方面 , 随 着 (新 文科 建设 宣 
证 2 的 发 布 ,我 国人 文 社 科 研究 正式 进入 全 新 的 历史 时 
期 习 第 四 范式 "的 数据 驱动 型 研究 在 人 文 研究 领域 获 
得 它 泛 推崇 。 王 丽华 ,刘炜 2 以 “数字 人 文 堆栈 2.0” 
的 通论 模型 为 新 文科 提供 了 颠覆 性 的 学 科 范 式 ,指出 
数字 人文 从 机 构 组成, 方法、 系统 和 界面 五 个 层次 以 
及 实体 与 精神 的 两 个 维度 为 新 文科 建设 提供 了 相应 的 
历 郁 点 和 借鉴 元 素 。 而 数字 人 文 项 目的 成 果 , 例 如 数 
据 集 、 工 具 系统、 可视化 作品 等 ,都 可 以 视 为 在 新 文科 
建设 背景 下 数字 人 文 乃至 新 文科 成 果 交流 的 一 种 重要 
旦 现 方式 。 另 一 方面 ,数字 人 文 项 目 建设 也 促进 了 中 
华文 化 的 传承 。 正 如 本 届 会 议 的 主题 “积淀 与 超越 : 数 
字 人 文 与 中 华文 化 ” ,汉语 语 境 下 的 数字 人 文 项 目 应 该 
包含 以 “ 仁 ” 为 中 心 的 中 国人 文 主义 洲 孵 ,以 及 以 儒家 


记忆 ,使 中 华 传统 文化 得 到 传承 ,为 中 华文 化 研究 做 出 
了 贡献 。 


7 _ 结语 


通过 对 51 个 项 目 进 行 梳理 和 综述 ,发 现 汉 语 语 境 
下 的 数字 人 文 项 目 主要 发 展 趋势 如 下 : 

(1) 史 学 和 文学 领域 是 数字 人 文人 研究 鞍 劲 发 展 的 
学 科 领 域 。 在 这 两 个 学 科 领 域 中 ,地 理 信 息 系 统 、 社 会 
网 络 分 析 文本 分 析 等 技术 被 广泛 应 用 。 语 言 艺术 学 
科 是 数字 人 文 项 目 建 设 的 新 领域 ,数据 可 视 化 技术 以 
及 优秀 的 视觉 传达 也 受到 数字 人 文 项 目 建设 者 的 诸多 
关注 。 

(2) 机 器 学 习 、VR/ZAR 技术 与 数字 人 文 结合 空间 
巨大 。 作 为 新 型 的 信息 技术 方法 ,VRAAR 技术 和 机 器 
学 习 ( 特 别 是 人 工 智 能 技术 ) 开始 被 引入 数字 人 文 项 
目 中 ,衍生 出 了 自动 作 诗 、 古 籍 自动 识别 .故事 地 图 、 游 
戏 化 学 习 等 新 的 研究 方向 和 应 用 场景 ,为 人 文学 者 和 
普通 用 户 都 提供 了 新 的 服务 和 体验 ,虚拟 现实 和 机 器 
学 习 会 是 数字 人 文 研究 的 新 热点 。 

(3) 数 字 资 源 建设 在 数字 人 文 基础 设施 建设 中 仍 
然 是 重 中 之 重 ,这 也 是 图 档 博 建设 者 的 天 然 使 命 。 而 
其 中 特 藏 资源 的 专题 数据 库 建设 又 是 数字 人 文 基础 设 
施 建设 的 重点 工作 。 数 字 资 源 的 建设 对 象 和 建设 内 容 
也 从 单一 的 文本 数据 ,发 展 为 非 结 构 化 数据 、 音 视频 、 
图 片 数据 的 建设 。 

(4) 综 合 性 数字 人 文平 台 开 发 与 建设 的 时 代 已 经 
到 来 。 项 目 开 发 方 在 某 一 类 型 资源 或 工具 开发 的 基础 
上 集结 历年 开发 经 验 和 基础 设施 资源 ,开始 进行 集成 
多 种 数字 资源 统一 服务 、 多 工具 共享 .提供 人 文学 者 研 
究 合作 、 成 果 发 布 服务 等 为 一 体 的 综合 性 数字 人 文平 
台 。 上 海 图 书馆 的 “历史 人 文大 数据 平台 ”中 国 知 网 
的 “数字 人 文 研 究 平台 ”都 是 其 中 的 领航 者 。 

(5 ) 跨 学 科 、 跨 机 构 、 跨 国家 的 合作 性 项 目 开 始 显 
现 。 数 字 人 文 作为 一 个 新 兴 的 交叉 学 科 与 文学 .历史 


“六 艺 ” 为 代表 的 人 文学 科 和 精神 积 演 ,从 而 具有 其 独 
特 的 内 涵 。 不 少 项 目 在 历史 文化 研究 方面 有 成 功 的 实 
践 经 验 , 例 如 中 国人 民 大 学 主持 的 “高 迁 古 村 数字 记忆 


学 .艺术 .语言 学 `. 计 算 机 科学 等 传统 学 科 呈 现 出 研究 
方法 交叉 融合 .内容 理念 交流 深入 \ 研 究 成 果 多 样 展现 
的 新 趋势 。 同 时 ,项 目的 建设 方 也 呈现 了 跨 机 构 、 跨 地 


网 站 ”项目 .武汉 大 学 建设 的 “基于 F 的 敦煌 壁画 数 


区 .跨国 家 的 项 目 交 流 合作 模式 。 


字 叙 事 系统 ”项目 和 ”敦煌 壁画 主题 词 表 及 关联 数据 
发 布 服务 平台 ?项目 .北京 大 学 参与 的 “中 国 历代 人 物 
传记 资料 库 (CBDB) "项 目 以 及 中 南 民 族 大 学 开发 的 
“ 唐 宋 文学 编 年 地 图 "项 目 等 。 这 些 项 目 , 用 数字 人 文 
的 理论 .方法 和 技术 保护 \ 传 承 、 构 建 及 呈现 中 华文 化 


同时 ,研究 也 发 现 当前 数字 人 文 项 目的 建设 和 发 
展 存 在 以 下 不 足 , 未 来 数字 人 文 项 目的 开展 需要 进行 
针对 性 的 布局 谋 篇 : 

(1) 文 献 资 源 数 据 化 程度 不 足 。 包 括 了 文本 的 获 
取 不 充分 版权 垄断 和 开放 获取 程度 不 足 等 , 非 结 构 化 
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的 文本 资源 限制 了 人 文学 者 的 研究 也 制约 了 数字 人 文 
项 目的 开发 深度 。 继 续 加 强 数字 资源 基础 设施 建设 的 
同时 ,应 鼓励 将 数字 化 资源 开放 给 学 者 ,加强 机 构 间 合 
作 , 避 免 重复 建设 。 

(2) 多 学 科 交 又 融合 度 仍然 不 足 。 虽 然 跨 学 科 的 
趋势 开始 呈现 ,但 是 数字 人 文学 科 的 边界 仍然 模糊 ,从 
而 导致 了 人 文 研究 数字 化 和 数字 技术 人 文化 两 个 维度 
未 能 很 好 的 融合 ,未 能 在 人 文 研究 与 数字 技术 的 跨 学 
科 结 合 中 起 到 桥梁 作用 。 因 此 ,应 当 加 强 多 学 科 的 交 
又 融合 ,使 更 多 的 领域 研究 专家 ( 领域 专家 .数据 科学 
家 .算法 工程 师 ) 参 与 到 数字 人 文 项 目的 建设 中 来 。 

(3) 研 究 工具 和 数据 运用 的 科学 训练 不 足 。 虽 然 
已 经 出 现 综合 性 数字 人 文平 台 的 建设 ,但 是 仍然 缺少 
综合 性 .系统 性 的 数字 人 文 培训 的 平台 和 案例 。 各 机 
村 要 加 强大 数据 交叉 思维 和 人 文 素养 的 培养 ,引发 
党 考 对 数字 新 技术 和 新 展现 方式 的 探索 与 思考 。 

村 44) 数字 人 文 基础 设施 建设 和 数字 人 文 研究 发 展 
不 殉 配 。 继 续 提升 学 科 服务 能 力 和 基础 资源 建设 , 基 
础 座 施 建设 要 与 时 俱 进 并 且 依 靠 各 个 学 科 的 创新 。 同 
大 折 展 新 的 人 文 领域 研究 范畴 ,响应 教育 部 新 文科 奸 
设 的 号 召 ,促进 数字 人 文 研究 领域 理论 的 体系 化 成熟 
f 

- “(5) 区 域 发 展 不 平衡 。 一 线 城市 机 构 主持 建设 的 
数学 人 文 项 目 占 比 超过 半数 ,上 海北 京 是 国内 数字 人 
浪 究 的 领先 地 区 。 中 东部 地 区 数字 人 文 项 目 建设 水 
痊 于 西部 地 区 ,江苏 ,浙江 ,湖北 是 国内 数字 人 文 项 
目 建设 的 第 二 梯队 区 域 。 港 澳 台 地 区 特别 是 台湾 地 区 
十 驮 重视 数字 人 文 领 域 的 建设 与 投入 。 区 域 发 展 的 不 
平衡 既是 经 济 和 社会 发 展 存在 差异 的 体现 ,更 是 数字 
人 文 项 目 建设 主体 即 高 校 和 图 档 博 机 构 的 建设 意识 和 
实际 投入 不 均衡 所 导致 。 会 议 期 间 发 起 成 立 的 中 国 索 
引 学 会 数字 人 文 专业 委员 会 ,工作 成 效 显著 ,成 员 单位 
发 展 势头 迅猛 , 短 短 半年 已 经 有 云南 大 学 历史 与 档案 
学 院 数字 人 文 工 作 室 等 13 家 数字 人 文 机 构 加 入 。 发 
民 和 团结 更 多 不 同 地 区 的 数字 人 文 机 构 和 组 织 加 入 数 
字 人 文 专业 委员 会 ,推动 国内 其 他 如 中 西部 地 区 的 数 
字 人 文 项 目 及 相关 领域 工作 的 研究 探索 ,加 强 区 域 间 
协同 发 展 也 是 专 委 会 的 工作 目标 之 一 。 
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> Shen Lili Zhang Hongling Han Chunlei Liu Wei 

"t Shanghai Library, Shanghai Institute of Science and Technology Information, Shanghai 200031 
=; Abstract: | Purpose/ significance | This paper analyzes 51 digital humanities projects in Chinese context which 
Gs)collected at the 2020 digital humanities conference held by Shanghai Library. This paper summarizes the general 
situation of digital humanities projects on Chinese cultural themes in the Chinese context, and provides reference for 
future development of digital humanities in China. | Method/process | The 51 projects were analyzed by network 
Gurvey and data analysis, and classified according to the different research objects and contents. Meanwhile, valuable 
tures were obtained by analyzing and discussing the research methods , implementation conditions and practical sig- 


»&« 


Giificance of the project results. This paper discussed four dimensions of “ Digital Humanities and humanities" “ Appli- 


m m 
Tation of technical means and methods 


»&« 


infrastructure construction" and "extended service and problem solving". 
Sdtesult/ conclusion | The overview of 51 projects show five characteristics; Digital Humanities is flourished in the 
fields of history and literature, and has deep combination of machine learning. The construction of digital resources is 

tn the top priority. The era of Comprehensive Digital Humanities platform has come , and interdisciplinary , inter in- 
"re utional and international cooperative projects have also begun to appear. In view of the shortcomings in the con- 
struction and development of Chinese Digital Humanities projects, this paper also puts forward the main suggestions to 

promote inter agency cooperation and interdisciplinary integration, to strengthen the cultivation of big data cross 

thinking and humanistic quality, and continue to improve the subject service ability and basic resources construction. 

Keywords: digital humanities DH2020 digital humanities annual conference Chinese culture project anal- 


ysis 


数据 分 析 与 知识 发 现 ,2021 ,5 (1) :36 -55. [26] 王丽华 ,刘炜 . 助力 与 借 力 :数字 人 文 与 新 文科 建设 [本 .南京 社 


17 


